Visualização de Dados

Aula 2

Prof. Washington Santos da Silva

IFMG - Campus Formiga

25 de agosto de 2025

Nesta Aula

Tópicos

  • Ambiente Computacional - Parte 2
    • Git e GitHub: Visão Geral e Fluxo de Trabalho
    • Introdução Sistema de Publicação Quarto
    • Sessão Prática: 01-relatorio.qmd - Sistema de Publicação Quarto - Linguagem R

Diretrizes para Aulas Mais Produtivas

🔊 Mantenha conversas em volume baixo

⌨️ Código com método:

95% dos erros são evitáveis com:

  • Atenção na digitação
  • Respeitar a sequência lógica de etapas
  • Revisão antes de pedir ajuda

🤝 Inteligência colaborativa:

  • Compartilhe conhecimento
  • Resolva questões técnicas simples com colegas próximos
  • Reserve ao professor as dúvidas conceituais complexas

💪 Capacidade de Resolver Problemas

Cada erro resolvido é uma evolução da sua habilidade analítica

Introdução ao Git e GitHub

O que é Git?

Um sistema de controle de versão

  • Um “sistema de salvamento inteligente” que registra cada versão dos seus documentos.

  • Armazena apenas as mudanças entre versões, economizando espaço.

  • Funciona como uma “máquina do tempo” para seu trabalho.

  • Facilita o trabalho em equipe sem conflitos graves.

Por que usar Git?

Principais vantagens

  1. Controle de Versões: Permite rastrear mudanças em seu código e suas alterações.

  2. Recuperação de trabalho: Se algo der errado, você pode voltar facilmente a uma versão anterior que funcionava.

  3. Evita a confusão de múltiplas versões: Adeus a arquivos como “Relatorio_Final_v2_Revisado_Corrigido.docx”.

    • Git não rastreia alterações internas em arquivos binários como .docx; ele apenas detecta que o arquivo mudou.
  4. Trabalho colaborativo organizado: Múltiplas pessoas podem trabalhar no mesmo projeto sem sobrescrever o trabalho umas das outras.

  5. Documentação automática: O histórico de alterações serve como documentação da evolução do seu trabalho.

  6. Padrão no mercado e na comunidade científica: Conhecimento valorizado e amplamente exigido.

Comandos essenciais do Git

Comandos Essenciais

Os quatro comandos básicos que você usará com mais frequência (seu fluxo de trabalho padrão no Terminal do RStudio) são:

  • git status: consulta o estado atual dos seus arquivos
  • git add: prepara as mudanças para serem salvas
  • git commit: salva as mudanças no repositório local
  • git push origin main: envia as mudanças para o GitHub

Pense nestes comandos como um processo de 4 passos:

  1. Verificar o que mudou (status) -> arquivos e pastas em vermelho foram alterados/criados ou não estão sendo rastreados pelo Git.
  2. Adicionar/Selecionar o que você quer salvar (add).
  3. Salvar as mudanças localmente com uma mensagem descritiva (commit).
  4. Enviar para o GitHub (“nuvem”) (push).

O que é GitHub?

Uma plataforma colaborativa baseada em Git

  • “Nuvem para projetos Git” - armazena seus repositórios online
  • Facilita compartilhamento e colaboração em projetos
  • Oferece ferramentas para revisão de código, discussão e documentação
  • Funciona como um portfólio para profissionais e estudantes

Fluxo de trabalho com Git e GitHub

Figura 1: Fluxo de trabalho Básico

Publicando o Projeto RStudio no GitHub

Sincronizando o repositório local com o GitHub

  • Para publicar seu projeto RStudio no GitHub, você deve usar a seguinte sequência de comandos no terminal do RStudio:
  1. No terminal do RStudio, verifique quais arquivos/pastas foram modificados ou criados com:
git status
  1. Você pode adicionar todos os arquivos de uma vez com:
git add .
  1. Execute git status novamente para confirmar que todos os arquivos foram adicionados (aparecerão em verde sob “Changes to be committed”):
git status
  1. Se tudo estiver em verde, faça um commit com uma mensagem descritiva:
git commit -m "primeiro commit do projeto"
  1. Se algum arquivo ou pasta ainda aparecer em vermelho após o segundo git status, adicione as pastas/arquivos um por um:
git add relatorios/01-relatorio/01-relatorio.qmd
  1. Execute git status novamente e faça o commit quando todos os arquivos estiverem em verde:
git commit -m "primeiro commit do projeto"
  1. Envie/Sincronize o repositório local atualizado para o GitHub:
git push origin main

Publicando o Projeto RStudio no GitHub

Vá até seu repositório no GitHub

  • Atualize a página do seu repositório no GitHub (F5)

  • Verifique se os arquivos foram enviados corretamente

  • Se tudo estiver correto, você verá a estrutura de pastas e arquivos que criou no RStudio

Boas práticas

Descrição

  • Versionando o que é importante

    • Código-fonte (arquivos .R, .py, .qmd)
    • Dados brutos (se não forem muito grandes)
    • Documentação (.md, README)
  • Ignorando o que é regenerável

    • Resultados que podem ser recriados executando o código
    • Configurações específicas do ambiente de cada usuário
    • Arquivos temporários e de cache

Recursos adicionais

Introdução ao Sistema de Publicação Quarto

O que é o sistema de publicação Quarto?

Definição

  • É um sistema de publicação científica e técnica de código aberto que une texto narrativo e código para produzir documentos elegantemente formatados.

  • Com o Quarto, você pode criar diversos produtos:

    • Relatórios (html, pdf, docx )
    • Apresentações (RevealJS, Beamer,…)
    • Dashboards, websites, blogs e livros

O que é o sistema de publicação Quarto?

Figura 2: Sistema Quarto: um formato, diversos produtos.

Como funciona o Quarto?

Figura 3: Funcionamento do Sistema Quarto com a linguagem R.

Definição

  • Quando você renderiza um arquivo Quarto (que possui a extensão .qmd) contendo código R, primeiro o pacote knitr da linguagem R executa todas as células de código R e cria um novo arquivo markdown (.md), que inclui o código e sua saída.

  • O arquivo markdown gerado é então processado pelo programa pandoc, que gera o formato escolhido.

  • O botão Render do Rstudio encapsula essas ações e as executa na ordem correta para você.

Sistema Quarto e RStudio

Integração com RStudio

No RStudio, você pode criar e editar arquivos Quarto facilmente:

  • File → New File → Quarto Document/Presentation
  • Botão “Render” para renderizar o arquivo.

Por que usar o sistema Quarto?

Principais benefícios

  • Reprodutibilidade: Documenta todo o processo de análise de dados, garantindo que seu trabalho possa ser reproduzido.

  • Integração de código e narrativa: Combina texto explicativo, código e resultados em um único documento.

  • Múltiplos formatos de saída: Gera diferentes formatos (html, pdf, docs, apresentações) a partir do mesmo arquivo fonte.

  • Atualizações automáticas: Ao modificar dados ou código, basta renderizar o documento para atualizar todos os resultados.

Anatomia de um Arquivo Quarto

Anatomia de um Arquivo Quarto

Nota

Um arquivo Quarto (.qmd) consiste de três elementos fundamentais:

  1. Metadados (YAML): Controla o formato e opções do documento
  2. Texto em Markdown: O conteúdo narrativo do documento
  3. Células de Código: Código executável com suas opções

Metadados (YAML)

---
title: "Análise de Vendas"
author: "Seu Nome"
format: 
  html:
    toc: true
    theme: cosmo
execute:
  echo: true
  warning: false
---

Atenção à indentação!

  • A sintaxe YAML é sensível à indentação
  • Use sempre 2 espaços para aninhar elementos
  • Erros de indentação são a causa mais comum de problemas

Texto em Markdown

Código Markdown:

# Título da seção

Este é um parágrafo com **texto em negrito** e *itálico*.

- Item da lista
- Outro item
  - Subitem

[Link para tutorial](https://website.com)

Tutorial sobre Markdown

Tutorial completo

Acesse o tutorial sobre Markdown para mais detalhes.

Células de Código

Exemplo de célula de código R básica:

```{r}
# cria um vetor numérico de 1 a 10
x <- 1:10

# calcula a média amostral
mean(x)
```

O resultado é:

[1] 5.5

Células de Código

Como inserir células de código quarto no RStudio?

Você pode adicionar uma célula de código de três maneiras:

  1. Usando o atalho de teclado: Ctrl+Alt+I (Windows/Linux) ou Cmd+Option+I (Mac).

  2. Clicando no ícone CInsert a new code chunk” na barra superior de ferramentas do RStudio e selecionando “R”.

  3. Digitando manualmente os delimitadores de célula: ```{r} e `````.

Células de Código

Exemplo de célula de código R com opções:

```{r}
#| echo: true
#| warning: false
#| message: false

# Esta célula mostrará o código (echo: true), 
# mas ocultará avisos (warning) e mensagens
library(dplyr)
mtcars %>% 
  group_by(cyl) %>%
  summarise(
    n = n(),
    mpg_média = mean(mpg, na.rm = TRUE)
  )
```

Células de Código

O resultado do código anterior é:

# A tibble: 3 × 3
    cyl     n mpg_média
  <dbl> <int>     <dbl>
1     4    11      26.7
2     6     7      19.7
3     8    14      15.1

Figura com legenda

# Gráfico de dispersão entre consumo (hwy) e potência (displ)

# cria um sistema de coordenadas e elementos estéticos básicos
ggplot(ggplot2::mpg, aes(x = displ, y = hwy)) +
  # cria um gráfico de dispersão
  geom_point() +
  # aplica um tema minimalista 
  theme_minimal() +
  # define títulos e rótulos dos eixos
  labs(title = "Consumo de Combustível x Potência do Motor",
       x = "Cilindrada do Motor",
       y = "Milhas por Galão")

Figura com legenda

Figura 4: Gráfico de dispersão entre consumo e potência do motor.

Opções comuns para células de código

Opção Descrição Exemplo
echo Mostrar o código? #| echo: true
eval Executar o código? #| eval: true
warning Mostrar avisos? #| warning: false
message Mostrar mensagens? #| message: false
label Identificador único para uma figura #| label: fig-analise
fig-cap Legenda da figura #| fig-cap: "Gráfico de dispersão"

Opções comuns para células de código

Configuração global

Defina opções de código para todo o documento no YAML:

execute:
  echo: false
  warning: false
  message: false

Sessão Prática: Sistema Quarto e Linguagem R no RStudio

Sessão Prática

Vamos à prática!

Agora vamos ver um documento Quarto em ação no RStudio e uma pequena introdução à linguagem R.

  • Abra o arquivo 01-relatorio.qmd

Materiais para Estudar

Recursos para Aprendizagem

Tutorial e Guia de Consulta Rápida

Dicas para Aproveitarmos ao Máximo o Tempo

Para aproveitarmos ao máximo o tempo

Autonomia na Resolução de Problemas

  • Os códigos são testados previamente - erros costumam ser de digitação ou por pular etapas.

  • Revise seu código com atenção antes de solicitar ajuda.

  • Colabore com colegas próximos para resolver questões técnicas simples.

  • Reserve as dúvidas ao professor para conceitos ou problemas mais complexos.

Para aproveitarmos ao máximo o tempo

Ambiente de Aprendizado Colaborativo

  • Compartilhe conhecimento - explicar conceitos solidifica seu próprio entendimento.

  • Ao ajudar um colega, oriente sem resolver por ele.

  • Lembre-se: o progresso de cada um contribui para o aprendizado coletivo.

Para aproveitarmos ao máximo o tempo

Desenvolvimento de Sofisticação Técnica

  • A habilidade de resolver problemas técnicos é valiosa em qualquer área de atuação.

  • Aprenda a aprender” - invista tempo explorando além do que é apresentado em aula.

  • O objetivo não é apenas dominar ferramentas, mas desenvolver os pensamentos analítico e crítico.

  • Persista diante dos desafios - a resolução de erros é parte fundamental do processo de aprendizagem.

  • Documente suas descobertas para criar um repositório pessoal de conhecimento.

Referências

CHANG, W. R Graphics Cookbook. 2. ed. Sebastopol, CA: O’Reilly Media, 2025.
FARIA, P. D. Introdução à Linguagem R: Seus Fundamentos e sua Práticahttps://pedropark99.github.io/Introducao_R/, 2024.
WICKHAM, H. ggplot2: Elegant Graphics for Data Analysis. 3. ed. Cham: Springer, 2025.